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sequence reproduced in the specification or of its complementary 
strand, or of a deriv. of these. (A) has the activity of a 
transcriptional promoter. Also new are (1) recombinant DNA (A') contg . 
, (A) and (2) recombinant cells contg. (A) or (A'). 

Pref., (A') contains 1 or more structural genes plus segments 
which cause secretion of expression products. Partic . (A') is part of 
an expression plasmid of the autonomous or integrating types. 

USE/ADVANTAGE - (A) is a very efficient promoter in yeasts, esp. 
Kluyveromyces and is used to express recombinant genes partic. 
simultaneous expression in 2 opposite orientations. These genes are 
esp. those of pharmaceutical or nutritional interest, esp. that for 
human serum albumin (HSA) ( 
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@ Promoteur de levure et son utilisation. 

@ L'invention conceme des sequences d'ADN 
coniprenant tout ou partie du promoteur du 
g^ne PGK de K.lactis , ou d'un d6riv6 de celui-ci. 
et poss^dant une activity de promoteur trans- 
criptionnel. Elle conceme dgalement rutilisa- 
tion de ces sequences pour rexpresslon de 
gdnes recombtn^s. 
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La pr^sente invention concerne le domains de la 
biologie mol^ulaire. Plus particuli^rement, elle 
concerne une nouvelle sequence d'ADN pr^sentant 
una activity de pronrioteur transcriptionnel, des veo- 
teurs d' expression contenant cette sequence, et son 
utilisation pour la production de protdines, et par 
exemple de prot^ines h^t^rologues. L'invention 
concerne aussi les cellules recombln^es contenant 
cette sequence d'ADN. 

Les progr^s acconnplis dans le domaine de la bio- 
logie moiSculaire ont penmis de modifier des microor- 
ganismes pour leur faire produire des prot^ines hSt6- 
rologues. En particulter. de nombreuses etudes g^n^ 
tiques ont port6 sur la bact6rie E. coli. Toutefois, Tap- 
plication industrielle de ces nouveaux modes de pro- 
duction est encore limits, en particulier par les pro- 
blames d'efTicacit^ d'expression des g^nes dans ces 
microorganismes recombin^s. Aussi. dans le but 
d'augmenter les performances de ces syst^mes de 
production, des recherches ont 6t6 effectudes afin 
d'isoler des promoteurs forts, pennnettant d'obtenir 
des niveaux 6lev6s d'expression de prot^ines hStSro- 
' logues. Chez E.coli , on peut citer en particulier les 
promoteurs des op^rons tryptophane et lactose. 

Plus r^cemmenL chez la levure S. cerevisiae , 
des etudes ont portd sur des promoteurs d^riv^s de 
g&nes impliqu^s dans la glycolyse. On peut citer no- 
tamment les travaux sur le promoteur du g^ne de la 
3-phosphoglycerate kinase PGK (Dobson et al.. Nu- 
cleic Acid Res. 10, 1982, 2625 ; Hitzeman et al.. Nu- 
cleic Acid Research 1982. 7791), surceluidug&nede 
la glycerald6hyde-3-phosphate d6shydrog6nase 
GAPDH (Holland et al.. J.Biol.Chem. 254. 1979. 
9839 ; Musti et al.. Gene 25. 1983, 133). sur ceiui du 
g^ne de I'alcool d^shydrog^nase 1 ADH1 (Ben- 
nentzen et al., J.Biol.Chem. 257, 1982, 3018 ; Denis 
et al., J.Biol.Chem. 25, 1983. 1165), ou sur celui du 
g6ne de I'enolase 1 EN01 (Uemura et al.. Gene 45, 
1986, 65). 

R^cemment, des outils g^ndtiques ont 6td d^ve- 
lopp^s afin de se servir de la levure Kluyveromyces 
comme cellule hdte pour la production de prot^ines 
recombinantes. La mise en Evidence d'un plasmide 
de type 2-micron originaire de K-drosophilarum (plas- 
mide pKDI - EP 241 435) a pennis d'^tablir un syst^ 
me hdteA^ecteur tr^s efTicace pour la production de 
prot6ines recombinantes (EP 361 991). Cependant, 
les promoteurs utilises dans ce syst^me n'ont jamais 
^tA optimises. En particulier, ii s'agit essentiellement 
de promoteurs h^t^rologues. c'est-^dire provenant 
d'autres microorganismes. tel que notamment S. cere- 
vis iae. Cette situation peut engendrer diff^rents in- 
conv6nients, et notamment limiter Tactivit^ du promo- 
teur d cause de I'absence de certains dl^ments de la 
machinerie transcription nolle (par exemple de trans- 
activateurs), presenter une certainee toxicity pour la 
cellule hdte due d une absence de regulation, ou af- 
fecter la stability du vecteur. 



Dans ces conditions, le manque de promoteurs 
homologues forts chez Kluyveromyces constitue un 
facteur limitant dans I'exploitation industrielle de ce 
syst^me d'expression. 

5 La Demanderesse a maintenant identifid, clond et 

sequence une region du genome de Kluyveromyces 
lactis pr^sentant une activity de promoteur transcrip- 
tionnel (voir figure 1). Plus pr6cis6ment cette region 
correspond au promoteur du g6ne PGK de KJactis . 

10 Cette region, ou des ddriv^s ou fragments de celle-ci, 
peut 6tre utilis^e de mani^re tr§s performante pour la 
production de prot^ines recombinantes chez les levu- 
res du genre Kluyveromyces . II est entendu que cette 
sequence peut ^galement dtre utilis^e dans d'autres 

15 organismes hfites. 

Par ailleurs, Tanatyse de la region du genome de 
Kluyveromyces obtenue a penmis de mettre en Evi- 
dence 2 phases de lecture dans les 2 orientations op- 
pos^es (voir figure 2). Cette observation indique que 

20 le brin compl^mentaire de la region pr^ent^e sur la 
figure 1 possEde ^element une activity promotrice 
agissant dans I'autre orientation. 

Un objet de la pr^sente invention reside done 
dans une sequence d'ADN comprenant tout ou parte 

25 de la sequence pr^sent^e d ta figure 1 ou de son brin 
compl^mentaire, ou d'un d6riv6 de celles-ci, et pos- 
s^dant une activity de promoteur. 

Au sens de la pr6sente invention, on entend par 
ddrivE, toute sequence obtenue d partirde la s6quen- 

30 ce donnde dans la figure 1 par modifications structu- 
rales (mutations, deletions, substitutions, additions, 
fragmentations ... ) conservant une activity de promo- 
teur. En particulier, les mutations peuvent porter sur 
un ou plusieurs nucleotides, et les additions et/ou 

35 substitutions peuvent porter sur des Elements de re- 
gulation, ou des regions activatrices telles que les 
"UAS". 

Lorsqu'un derive est realise, son activite de pro- 
moteur transcriptionnel peut etre mise en evidence de 

40 plusieurs fa^ons, et en particulier en plagant sous le 
contr6le de la sequence etudiee. un gene de resistan- 
ce ou un marqueur de complementation. Toute autre 
technique connue de I'homme de I'art peut bien evi- 
demment etre utilise e d cet effeL 

45 Un objet plus particulier de l'invention conceme 

une sequence d'ADN con-espondant ^ la region 
comprise entre les 2 phases ouvertes ORF PGK et 
ORF X. telle que presentee sur la figure 6. 

Un autre objet de l'invention conceme un ADN re- 

50 combinant comprenant une sequence d'ADN telle 
que defmie ci-dessus. 

Cet ADN recombinant peut contenir par exemple 
la sequence promotrice presentee d la figure 1 ou un 
derive de celle-ci, dans laquelle est insere un site de 

55 restriction, facilitant I'utilisation de cette sequence 
comme promoteur, "portable". 

P referent! el lement cet ADN recombinant 
contient en outre un ou plusieurs genes de structure. 
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Encore plus pr6f6rentiellement, I'ADN recombi- 
nant contient 6galement des signaux penmettant la 
secretion du produit d*expression du ou desdits g^nes 
de structure. 

Dans un mode de realisation particuiier de I'in- 
vention, I'ADN reconnblnant fait partie d'un plasmide 
d'expression, qui peut 6tre d replication autonome ou 
Integra tif. 

En particuiier, des vecteurs d replication autono- 
me peuvent dtre obtenus en utilisant des sequences 
^ replication autonomes (ARS) chez Thdte choisl. No- 
tamment, chez la levure, il peut s'agir d'origines de r^ 
plication derivees de plasmides connus (pKD1, 2^, 
etc). 

Les vecteurs integratifs peuvent etre obtenus no- 
tamment en utilisant des sequences homologues ^ 
certaines regions du genome de I'hdte, permettant, 
par recombinaison homologue, {'Integration du vec- 
teur. 

La sequence presentee sur la figure 1 a ete ob- 
tenue par criblage d'une banque d'ADN genomique 
total de Kluyveromyces lactis au nnoyen d'une sonde 
heterotogue provenant du gene PGK de S. cerevisiae . 
La Dennanderesse a en effet montre qu'il est possible 
de doner une region promotrice chez Kluyveromyces , 
par hybridation e partir de sondes heterdogues 
correspondent d un gene de S. cerevisiae. Les details 
du donage de la sequence sont donnes dans les 
exemples. La region Intergenique peut ensuite dtre 
isoiee e partir de cette sequence, notamment par in- 
sertion de sites de restriction en utilisant la technique 
d*amplificatbn par PGR comma indique dans les 
exemples. 

Un autre objet de I'invention conceme les cellules 
recombinees contenant une sequence d'ADN telle 
que definie ci-avant 

Avantageusement les cellules sontchoisies par- 
mi les levures, et encore plus preferentiellemenL par- 
mi les levures du genre Kluyveromyces . II est entendu 
cependant que t'invention couvre toute les cellules re- 
combinees dans lesquelles les regions promotrices 
de I'invention sont actives. 

Ces cellules peuvent etre obtenues par toute me- 
thode permettant d'introduire un ADN etranger dans 
une cellule. II peut s'agir notamment de transforma- 
tion, eiectroporation, ou toute autre technique connue 
de rhomme de Tart. 

Un autre objet de invention concerne rutilisation 
d'une sequence telle que precedemment definie pour 
I'expression de genes recombines. 

Comme Tillustrent les exemples, les sequences 
d'ADN selon I'invention pemnettent en effet une pro- 
duction d des niveaux eieves de proteines recombi- 
nantes. 

Par ailleurs, I'activite promotrice bidtrectionnelle 
des sequences de invention penmet une utilisation 
particulierement avantageuse. Notamment il est pos- 
sible d'utitiser ces sequences dans les 2 orientations 



possibles, pour I'expression simultanee de plusteurs 
genes de structure. 

Avantageusement, I'invention conceme I'utilisa- 
tion d'une sequence telle que precedemment definie 
5 pour I'expression simultanee, dans les 2 orientations 
opposees, de genes recombines. 

Avantageusenr>ent, les sequences de invention 
peuvent etre utOisees pour I'expression de genes co- 
dant pour des proteines d'interet phanmaceutique ou 
10 agroalimentaire. A titre d'exemple, on peut citer les 
enzymes (tels que notamment la superoxide dismuta- 
se, la catalase, les amylases, les lipases, les amida- 
ses, la chymosine etc.), les derives sanguins (tels que 
la serum-albumine, I'alpha- ou la beta-globine, le fac- 
ts teur VIII, le facteur IX, le facteur van Willebrand, la Ti- 
bronectine. I'alpha-I antitrypsine etc.), Tinsuline et 
ses variants, les lymphokines (telles que les interleu- 
kines, les interferons, les facteurs de stimulation des 
colonies (G-CSF, GM-CSF. M-CSF...), leTNF. le TRF 
20 etc.), les facteurs de croissance (tels que Thormone 
de croissance, rerythropoietine, le FGF, TEGF, le 
PDGF, le TGF etc.), les apolipoproteines, des poly- 
peptides antigeniques pour la realisation de vaccins 
(hepatite, cytomegalovirus, Eppstein-Barr, herpes 
25 etc.), ou encore des fusions de polypeptides telles 
que notamment des fusions comportant une partie ac- 
tive fusionnee ^ une partie stabilisatrice (par exemple 
des fusions entre I'albumine ou des fragments d'albu- 
mine et le recepteur ou une partie d'un recepteur de 
30 virus (CD4, etc)). 

L'inventk)n sera plus compietement decrite e 
t'aide des exemples qui suivent, qui doivent etre 
consideres comme illustratifs et non limitatifs. 

35 LEGENDE DES FIGURES 

Figure 1 : Sequence nucieotkiique de la region de 
2,2 kb du fragment chromosomique situe en 
anDont du codon d'initiation de la traduction du 
^ 9^rie PGK de K. lactis possedant I'activite promo- 

trice. 

Figure 2 : Analyse des phases ouvertes de lectu- 
re. Les demi-b^its verticaux representent des co- 
dons d'initiation de la traduction. Les traits verti- 

45 caux entiers representent des codons stop. Les 
regions daires mettent en evkJence les phase ou- 
vertes de lecture (ORF X et ORF PGK). 
Figure 3 : Carte de restriction du plasmide 
pYG610. La region noire correspond d la region 

50 isoiee du genome de K.lactis . 

Figure 4 : Strategie de sequen^age du fragment 
Xba l de 2,5 kb. 

Figure 5 : Sequence et localisation des ollgo- 
deoxynudeotides utilises dans la reaction de 
55 PCR, pour insertion d'un site Hindlll en -6 de 

I'ATG de la sequence de la figure 1. Les oligo- 
deoxynudeotides sont representes en italique. 
L'ATG correspond au codon d'initiation de la tra- 
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duction du g6ne PGK. 

Figure 6 : Sequence nucl^otidique de la region in- 
terg^nique du fragment 2.2 kb. 6(a) : oligod^xy- 
nucleotides utilises dans la reaction de PGR. 
6(b) : Fragment Sa[(l)- Hind III correspondant aux 
nucltotides 1343 ^ 2246 sur la sequence de la fi- 
gure 1. 

Figure 7 : Strat^gie de construction du plasmide 
pYG45. 

Figure 8 : Strat^gie de construction de cassettes 
d'expression de la sdrum-albumlne hunf^ine. 
Figure 9 : Strat^gie de construction du plasmide 
pYG65, 

Figure 1 0 : Strat6gie de construction du plasmide 
pYG70, 

Figure 11 : Strat6gie de construction du plasmide 
pYG72. 

Figure 12 : Strategic de construction du vecteur 
pYG621. 

Figure 13 : MIse en Evidence par "North em blot" 
de {'expression du g^ne de Talbumine humaine 
sous ta dependence du promoteur PGK de K.lac- 
tis. Les echantillons con'espondentd 10^g d*ARN 
total. 1 8S et 28S sont les positions des ARN ribo- 
somiques 1 8S et 28S. ALB = fragments reconnus 
par la sonde conrespondant au g^ne de I'albumi- 
ne; URA = fragments reconnus par la sonde 
correspondant au gfene URA A de K.lactis servant 
de temoln de d^pdt 

Figure 14 : MIse en evidence de la production 
d'albumine dans les souches transfonmees par le 
vecteur d'expression pYG621 contenant le pro- 
moteur PGK de K-lactis . Les 6chantillons corres- 
pondent ^ 30 ^1 de sumageant de culture ; les 
bandes au niveau du marqueur 66 kd correspon- 
dent d Talbumine. M = marqueurs de masse mo- 
leculaire : anhydrase cart>onique bovine (31 Kd), 
ovaibumine (45Kd). BSA (66Kd), phosphorylase 
b de lapin (92kd). 

EXEMPLES 

1/ Isolement de la region promotrice du gene PGK 
de K lactis. 

La sequence presentee sur la figure 1 a ete ob- 
tenue par criblage d'une banque d'ADN genomique 
total de Kluyveromyces lactis CBS2359 au nrioyen 
d*une sonde heterotogue provenant du gene PGK de 
S. cerevisiae (Dobson et al.. Nucleic Acid Res. 1982. 
10, 2625). Plus precisement la sonde utilisee corres- 
pond au fragment N-tenminal Pvu l- EcoR I de 1 ,3 kb du 
g6ne PGK de S. cerevisiae . 

En "Southern blot" (Southem et al.. J.Biol.Chem.. 
1975, 98, 503), la sonde utilises s'hybride avec deux 
fragments differents lorsque i'ADN genomique estdi- 
gere par XBa l. L*un d'eux, de 2,5 kb environ, a ete iso- 
le par criblage d'une banque genomique restrelnte de 



K. lactis CBS2359, constituee de fragments d'ADN 
coupes par Xba l, d'une taille comprise entre 2 et 3 kb, 
introduits dans le plasmide pUC18 au site Xbal. Une 
banque de 500 clones a ainsi ete constituee, puis cri- 

5 biee avec la sonde heterologue decrite ci-dessus. 

Par hybridation sur colonies, un done a pu dtre 
identrfie et son ADN plasmidique a ete prepare. Ce 
plasmide (pYG610) contient un fragment d'ADN ge- 
nomique de 2.5 kb. dont la carte de restriction est pr6- 

10 sentee ^ la figure 3. Le plasmide pYG61 1 contient le 
mSme insert dans la direction opposes (voir figure 8). 

Dans une seconde etape, le fragnr>ent de 2,5 kb 
ainsi Isoie a ete sequence, en utilisant ta methode de 
Sanger (Sanger et al., Proc. Nat Acad. Scl 74, 1977, 

15 5463). Pour cela, le fragment issu de pYG611 a 
d'abord ete sous-done dans les bacteriophages 
M13tg130 etM13Jg131.Lastrategie de sequenpage 
du fragment est schematisee sur la figure 4. 

L'analyse de la sequence obtenue montre que le 

20 fragment Isoie contient une partie codant pour la r^ 
gion N-temninale de la proteine Pgk de Kluyveromy- 
ces lactis (0,3 kb), et 2,2 kb correspondant d la region 
promotrice situee en amont du site d'inrtiation de la 
traduction. Elle montre de plus que, dans Torientation 

25 opposes par rapport au gene PGK , se situe une se- 
conde phase de lecture situee d environ 0,9 kb en 
amont de I'ATG du gene PGK (figure 2). 

La comparaison de cette sequence avec celle du 
promoteur du g6ne PGK de S. cerevisiae fait apparai- 

30 tre Tabsence d'homologie particuliere. notamment 
avec son element de regulation. Cette sequence 
correspond done h une region promotrice entierement 
originate, tres distincte de celles dejd decrites, sur le 
plan de sa structure, et par consequent sur le plan de 

35 sa regulation. 

21 Construction de vecteurs d'expression pour la 
production de proteines het6rologues : 

40 Cet exemple illustre rutiiisation des capacites 

promotrices de ta sequence de 2.2 kb de la sequence 
de la figure 1 et de sequences derivees. 

a) Insertion d'un site de restriction en -6 de TATG. 

45 

L'insertion de ce site pennet ensuite d'introduire 
en aval du promoteur obtenu tout gene que Ton desire 
exprimer. Pour des raisons de compatibilite avec des 
vecteurs d'expression existent (EP 361 991). des pro- 
50 moteurs "portables" ont ete construits sous fonne de 
fragments Sall- Hind lll. 

Un site Hindi II a ete introduit en position -6 par 
rapport au site d' initiation de la traduction (ATG) du 
gene PGK en utilisant la technique d'amplification par 
55 PCR (Mullis et al., Meth.Enzymol. 155. 1987, 335). 
Dans ce but, 2 oligodeoxynucieotides ont ete utilises, 
qui sont presentes sur ta figure 5. 

L*oligodeoxynudeotide A con'espond e ta se- 
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quence situ^e k 467 pb en amont du codon ATG, au 
niveau d'un site Hindlll. qui sera ainsi rennplac^ par un 
site Sa[l lors de Tampliftcation. L'ollgod^oxy nucleoti- 
de B correspond d la sequence en amont du site d'ini- 
tiation, et permet d'introduire un site Hindi II en posi- 
tion -6. 

Le fragment obtenu par PGR a 6t6 ins^r^ entre 
les sites Sa[l et Hindlll du bacteriophage M13tg130 
afin de verifier par s^quengage que des mutations ne 
sont pas apparues lors de I'amplification. 

b) Construction de cassettes d'expression de la 
s6runrvalbumine humaine : figure 8. 

L'ADN recombinant de 474 pb obtenu ci-dessus 
a ete introduit au niveau des sites Sa[l et Hind lll. dans 
le plasmide pYG45 (figure 7) pour obtenir le vecteur 
pYG614 (figure 8). Le plasmide pYG45 contient une 
cassette d'expression constitute du promoteur et du 
terminateur du g6ne PGK de S. cerevisiae entre les- 
quets, au niveau d'un site Hind lll, est insert le g^ne 
codant pour la prtpro-s^nvalbumine humaine (s^ 
quence pr6p[D-HSA). pYG45 est d6riv6 de pYG18 
(voir brevet EP 361 991) par sous-clonage du frag- 
ment Sall - BamHI contenant la cassette d'expression 
HSA. dans les sites con-espondants du vecteur pIC- 
20RDH (figure 7). plC-20RDH est obtenu par diges- 
tion du plasmide plC-20R (March et al., Gene 32, 
1984, 481) avec Tenzyme Hind lll, remplissage des 
extr6mit6s avec le fragment Klenowde la polymerase 
I d' E.coli et recircularisation avec la T4 DNA iigase. 

A partir du plasmide pYG614, le fragment Sal l- 
Sacl peut Stre isol6 par digestion, li contient : une re- 
gion promotrice derivte de la sequence de la figure 1 , 
le gtne de I'albumine et le tenninateur du gdne PGK 
de S. cerevisiae . II constitue une cassette d'expres- 
sbn qui peut dtre instrte dans un plasmide pour 
constituer un vecteur d'expression. 

Une autre cassette d'expression peut dtre obte- 
nue ^ partir du plasmide pYG614» par donage du frag- 
ment Afllll- Sac I contenant une partie du promoteur 
PGK de invention, le g6ne de I'albumine (prtpro- 
HSA) et le terminateur PGK de S. cerevisiae dans le 
plasmide pYG61 1 d6crit pr6alablement. Ceci g6n6re 
le plasmide pYG615. Le fragment Sall-SacI conte- 
nant : la region promotrice de la figure 1 enti^re, le 
g6ne codant pour la pr6pro-s6rum-albumine, et le ter- 
minateur du g6ne PGK de S. cerevisiae, peut ensulte 
dtre isoie par digestion. Ce fragment constitue une se- 
conde cassette d'expression de I'albumine utilisant la 
sequence promotrice de I'invention. 

c) Construction de vecteurs d'expression de 
I'albumine. 

Des vecteurs d'expression de I'albumine peuvent 
dtre construits par insertion des cassettes d'expres- 
sion obtenues ci-dessus dans des plasmides navet- 



tes K.lactis/E.coli tels que pYG72 (figure 10). En par- 
ticulier, un vecteur d'expression a ett obtenu (vecteur 
pYG621) par insertion du fragment Sall- Sac I de 
pYG61 5 contenant la cassette d'expression de I'albu- 

5 mine dans le vecteur pYG72 (voir figure 1 0). Ce vec- 
teur coHBspond au plasmide pKan 707 (voir EP 361 
991) dans lequel le fragment Sad contenant le gtne 
URA 3 a ete ^limine, ainsi que le site unique Hind lll 
present dans le gtne aph pour faciliter les construc- 

10 tions ulttrieures. Le g^ne aph code pour I'aminogly- 
coside 3'-phosphotransferase (I) (Oka et al., J. Mol- 
Biol. 147, 1981, 217) et est utilise comme marqueur 
de resistance au G418 chez la levure. Le fragment 
Pst I du plasmide pKan707 contenant le gene aph a 

15 ete sous-done dans le bacteriophage M13mp7 pour 
donnerle vecteur pYG64 (figure 9). Le site Hind lll pre- 
sent dans ce gene a ete debuit par mutagenese diri- 
gee selon la methode decrite par Taylor et al. (Nucleic 
Acid Res. 13, 1 985, 8749). Le plasmide resultant a 6te 

20 appeie pYG65 (figure 9). L'oligodeoxynudeotide uti- 
lise pour la mutagenese avait la sequence 5'-GAA 
ATG CAT AAG CTC TTG CCA TTC TCA CCG -3' et 
transfbrmait le triplet CTT codant pour I'acide amine 
1 85 (Leu) en CTC. Ce changement ne nx)difie pas la 

25 sequence proteique resuttante. Pour construire le 
plasmide pYG72, la partie contenant le replican bac- 
terien du vecteur pKan707 a ete isoiee par digestion 
avec I'enzyme EcoRI et recircularisatbn avec la T4 
DNA Iigase pour obtenir pYG69. Le fragment PstI pre- 

30 sent dans ce demier vecteur contenant le gene aph a 
ete remplace par le fragment equivalent mute prove- 
nant de pYG65. Cette construction a ete appeiee 
pYG70. La sequence de pKD1 de4,7 kb comprise en- 
tre les sites EcoR I et Sad a ete introduite dans ce der- 

35 nier vecteur pour obtenir pYG72. Le vecteur pYG621 
(figure 1 1 ) a ete obtenu par insertion du fragment Sall- 
Sac I contenant la cassette d'expression de I'albumine 
provenant de pYG615. 

40 3/ Construction d'une cassette permettant d'utiliser 
la region promotrice dans les 2 orientations . 

Cette constructk>n a ete obtenue par introduction 
d'un site Sail et d'un site Hind lll de part et d'autre de 
45 la region comprise entre les 2 phases ouvertes de lec- 
ture identifiees sur la figure 2: ORF PGK et ORF X, 
soit au niveau des nudeotides 1343 et 2246 sur la fh 
gure 1 . 

Cette construction a ete realisee par la technique 
50 de PCR en utilisant d'une part l'oligodeoxynudeotide 
A qui introduit un site Sai l en position -1 par rapport 
au site d'initiation de la traduction du gene PGK, et 
d'autre part l'oligodeoxynudeotide B qui introduit un 
site Hind lll en position -1 par rapport au site d'initia- 
55 tion de la traduction du gene X (voir figure 6(a)). En- 
suite, pour eiiminer un site Hindlll present dans la re- 
gion promotrice, 3 reactions de PCR ont ete effec- 
tuees en utilisant e chaque etape le plasmide pYG610 
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comme matrice : 

- les 2 premieres, pour amplifier les regions de 
part et d'autre du site Hind lll en utilisant les otigo- 
d^oxynuelSotides A et B couples respectivement 
aux oligod^oxynucldotides C et D (figure 6). Ces s 
2 derniers sont complSmentaires et permettent 
d'introduire une mutation ponctuelle au niveau du 

site Hindlll inteme ; 

- la dernidre, en utilisant les 2 produits d'amplifi- 
cation pr^c^dents comme anDorce. pour gSn^rer io 
le fragment final contenant la region promotrice 
modifi^e. 

Cette region peut ensuite Stre introdutte dans les 
vecteurs d Merits dans I'exemple 2, et utilis6e comme 
promoteur bidirectionnel. is 

4/ Expression d'albumine 

Le vecteur pYG621 a 6t6 introduit par transfomna- 
tion dans la souche K.lactts MW98-8C (CBS 579.88), 20 
en utilisant la technique ^thyldne glycol/dim^thyisul- 
foxyde (Durrens eta!., 1 990, Curr. Genet 18. 7). Cette 
souche derive de la souche sauvage CBS2359 et pr^ 
sente le genotype : Mat_, uraA, LysA, argA, K+, cir. 
Les levures transformdes sont sdlectionn^s pour le 25 
ph^notype "341 8-resistant" que confdre le plasmide 
pYG621 sur milieu YPD (extrait de levure 10 g/l, pep- 
tone 20 g/l, glucose 20 g/l) contenant de la g6n6ticine 
d 0,2 g/l. Des souches transform^es par le plasmide 
pYG72 ne contenant pas de cassette d'expression 30 
ont 6t6 s^lectionn^es pour servir de t^moin dans les 
tests de production. Par ailieurs, afin de comparer Tef- 
ficacit^ du promoteur PGK de K.lactis selon I'inven- 
tion par rapport d celui de S.cerevisiae , des souches 
transfoon^es par le vecteur pYG1 9 ont ^alement 6td 35 
s^lectionn^es. Le vecteur pYG19 est analogue au 
vecteur pYG621, sauf que le g^ne de Talbumine est 
sous le controte du promoteur PGK de S.cerevisiae 
(EP 361 991). 

40 

a) Analyse des ARNm : 

Les cellules sontcultiv^es d 28*'C en milieu s^lec- 
tif YPD (extrait de tevura 10 g/l, peptone 20 g/l, gluco- 
se 20 g/l) contenant de la g^ndticine ^ 0,2 g/l. Les 45 
ARN totaux sont extraits (Sherman et al.. Methods in 
Yeast Genetics, Cold Spring Harbor Lat>oratoty, 
1986, 143) et s6par6s par ^lectrophor^se sur gel 
d*agarose. Suivant la mdthode de "Northern blot" 
(Manlatis et al., 1 982 Molecular cloning, Cold Spring so 
Harbor, Laboratory Press), les ARN sont hybridSs ^ 
une sonde correspondant au g^ne de structure de Tal- 
bumine (fragment HindlM-Hindl 1 1 de 1,9 kb) provenant 
du vecteur pYGI 8 (figure 7). L'autoradiographie mon- 
tre dairement une bande de 2,3 kb sp^crfique de Tal- 55 
bumine (figure 13). Par ailieurs. il apparait dairement 
que le taux de transcription du g^ne de I'albumine est 
bien sup6rieur dans les souches contenant une re- 



gion promotrice de I'invention (pYG621). que dans 
celles contenant le promoteur PGK intact de S. cere- 
visiae (pYG19). 

b) Analyse des prot^ines : 

Les cellules sont cultiv^es en erlenmeyers dans 
un milieu s6lectif YPD (extrait de levure 1 0 g/I. pepto- 
ne 20 g/l. glucose 20 g/l) contenant de la g6n6ticine 
d 0.2 g/l ^ 28*'C sous agitation. Apr^ 96 heures de 
culture, 30 |il de sumageant sont pr^levds et mdlan- 
g^ S un volume Equivalent de tampon Laemmli 2X 
(Laemmli. 1970. Nature 227, 680). Apr^ chauffage d 
96"C pendant 10 minutes, les prot6inesde TEchantil- 
lon sont ensuite s6par6es sur gel de polyacrylamide 
SOS 8.5 %. La production d'albumine est ensuite r^ 
vEI^ par coloration du gel au bleu de coomassie, puis 
est 6valu6e pour les diff6rents vecteurs utilises. La fi- 
gure 14 montre que les 4 dones obtenus s6par6ment 
par transfonmation de la souche MW98-8C par le vec- 
teur pYG621 s6cr^tent beaucoup plus d'albumine 
que ceux obtenus par transformation avec le vecteur 
pYG19. 

11 est dair que la r6gion pronriotrice de Tinvention 
permet une excellente production d'albumine par la 
levure. supErieure d celle obtenue avec le promoteur 
PGK de S.cerevisiae . Cette r6gk)n, ou des formes r6- 
duites ou d^riv^es de celle-ci, constituent un outil in- 
dustnel important pour les systdmes de production 
microblologiques. et plus particulidrement eucaryo- 
tes. 



Revendications 

1 . S^uence d'ADN comprenant tout ou partie de la 
sequence pr^sentde ^ la figure 1 ou de son brin 
compl6mentaire, ou d*un d6riv6 de celles-ci. et 
possEdant une activity de promoteur transcrip- 
tlonnel. 

2. S^uence d'ADN selon la revendication 1 
comprenant tout ou partie de la sequence pr^sen- 
tde sur ia figure 6(b). 

3. ADN recombinant comprenant une sequence 
d'ADN selon les revendications 1 ou 2. 

4. ADN recombinant selon la revendication 3 carac- 
t6ris6 en ce qu'il contient en outre un ou plusieurs 
g^nes de structure. 

5. ADN recombinant selon la revendication 4 carec- 
t^risd en ce qu'il contient Egatement des signaux 
penmettant la secretion du produit d'expression 
du ou desdits g&nes de stnjcture. 

6. ADN recombinant selon I'une quelconque des re- 



6 



11 



EP 0 511 912 A1 



12 



vendications 3 d 5 caract^risd en ce qu'tl fait par- 
tie d'un plasmide d'expression, qui peut gtre ^ 
plication autonome ou int^gratif. 

7. Cellule recombinde contenant une sequence 5 
d*ADN ou un ADN recombinant selon Tune quet- 
conque des revendications pr^6dentes. 

8. Cellule recombin^e selon la revendication 7 ca- 
ractdris^e en ce qu'il s'agit d'une levure. io 

d. Cellule recombln^e selon la revendication 8 ca- 
ract^ris^e en ce qu'il s'agit d'une levure du genre 
Kluyveromyces. 

15 

10. Utilisation d'une sequence d'ADN selon I'une 
quelconque des revendications 1^6 pour {'ex- 
pression de g^nes recombin^s. 

11. Utilisation selon la revendication 10 pour I'ex- 20 
pression simultan^e, dans les 2 orientations op- 
pos^es, de g^nes recombin^s. 

12. Utilisation selon i'une des revendications 10 ou 

11 pour I'expression de g^nes codant pour des 25 
prot6ines d'int^rdt pharmaceutique ou agroali- 
mentaire. 

13. Proc6d^ de preparation d'une prot^ine recombi- 
nante par expression de son g^ne dans un hdte 30 
cellulaire caract^ris^ en ce que {'expression dudit 
g^ne est sous le contr6le d'une sequence selon 

la revendication 1. 

14. Proc^dd selon la revendication 13 caractSrisd en 35 
ce que la protSine est la s^mnrvalbumine humai- 

ne. 
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ATAAATTGTA 




730 
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750 
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CCGTAAGTAT 


ACTGTTTGCC 


790 
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TCTGAGATCA 


TAAGTAACTG 


TTGAGCATCG 


850 


860 
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GTACCACTGC 


TTTGATGACA 


910 
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GCGAATCCAA 


CGGTTTTAAC 

X X X X •■■•^^ 


970 


980 


990 


ACGTCCCAAT 
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780 


TTGTCTCTGG 


TGAATTTATG 
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AAGTTGTTGT 


AGTTTGAAAT 
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TACCAATTCC 
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GGTTGATCAA 


CTCGATGAAA 
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1020 


TGATGTTCCA 


CCAAATTAAG 


ACAATATTTC 
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1070 
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CTGCCCTCAG 


CACTCGTAGA 


CACGAGTAAC 
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ATATCGTTCA 


ATAGACTATG 


GAACAAAGTG 


1180 


1190 


1200 


AACGATTGAA 


TAAGTGACGT 


CGATGCTAAA 
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1250 
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CCCATGAGAA 


CGACACGTTC 


CTCATCACTA 
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1270 1280 1290 1300 1310 1320 

GAAGCCGAAC TGTTGTCTTC AGTGGGGATT GGTTCGACAT TTTGCCAATT GCTGTCGATG 

1330 1340 1350 1360 1370 1380 

TACCCTTTCA AAGCCATGTA CCTTAAATCT TCATCCTTGG CAAGTAGATT CATCGGGTGT 

1390 1400 1410 1420 1430 1440 

GTTTGAAGTA AGAATATTTG CTTGTTTTTA TGGTATCAAA GGTATATGTT GTAGAAGACA 

1450 1460 1470 1480 1490 1500 

ATTTCCGGTA ATCCAATTGT CrGTCTGCTC AGTTTAGCAC ATGTATAGTA CGTTGCACAT 

1510 1520 1530 1540 1550 1560 

AGTCTACAAT ATTCAGCATT CAGCATTCAG XATACAGCAT ATGGCTAAAT GATCACAAAT 

1570 1580 1590 1600 1610 1620 

GTGATTGATG ATTTGACACG ACTAGAAAAG AGAACGAAAA AGGGAAATTC ATGTCACGTG 

1630 1640 1650 1660 1670 1680 

CGrrGGCACG TGACATGGAA TATCGAAGAA AGAAAAAAAA AAACGATCTC GTCCTAGTGG 

1690 1700 1710 1720 1730 1740 

AAGCCCAGAG TCTGGTCCCC CCGGAGTCTT CCCAAAACAA GAAGCTGACA CATGTTGACA 

1750 1760 1770 1780 1790 1800 

CAGAACACCC CACAGCAAAT GCACCACGCT ACGTAGATCA GGAAGCTTAA CTCTAGCGAC 

1810 1820 1830 1840 1850 1860 

CTGTCGCTCG CCCCACAGAA CCTCACCCGA GAACCACACA TTACACGCCG CCAGCTCCCA 

1870 1880 1890 1900 1910 1920 

CTATACTCAT CTTGCTTCCC TTAAGCGTTC TCACGATTCG TTCGCTGCCC TTCTTCAAGA 

1930 1940 1950 1960 1970 1980 

GTCTTCTGAT TCTAATTCTC ATTCGAAATC CTCTACAGTT AATGAATTGC TTGACATGAC 

1990 2000 2010 2020 2030 2040 

ATTCATTGTC TCATGGTTTT GGCTTTTTGG CTTTTGTCTT TTAAAGCTAT ATCAACTTTA 

2050 2060 2070 2080 2090 2100 

CAmifiAftXft TACGTCAAAA GGGGATTCAT TAATTAGAAA ATTCTCTTTT TCAATAGTTG 

2110 2120 2130 2140 2150 2160 

CTATTCATTA TCAATCTATT CAACTCAATT GGTTATTATT TTCATCTTTT TGTCATCCTA 

2170 2180 2190 2200 2210 2220 

AACCATCAAC AAXftJTTAAA_SmTCTGTT GCTACATTAA GAGTTACTIQJ^S^TAACA 

2230 2240 2250 

AAAAAATCGA TCAAGAATTA ATAAAAATG 

Met 
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Sail 

A 

5'GGGAATTCGTCGA 

CTTAACTCTAGCGACCTGTC 3' 

3 . TTCGAATTGAGATCGCTGGACAGGCAGCGGGGT 5 ' 

5' 3* 

-4 67 

Hindi 1 1 



3. 5» 

5 t CAAAAAAATCGATCAAGAATTAATAAAAATG 3 ' 

3 ' GTTTTTTTAGCTAGTTCTTAATT 

TCGAACTTAAGGG 5' 

B 

Hindi I I 
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01igod6soxynucl6otide A 
5 • CATfilCSA£TTTTTATTAATTCTTGATCGAT3 ' 
Sail 

Oligod6soxynucl6otide B 

5 • ATGMfi£IlAAATCTTCATCCTTGGC3 ' 

Hindlll 
Ollgod^soxynucleotide C 

5 'GGGTGAGGTTCTGTGGGGCGAGCGACAGGTCGCTAGAGTTAAGCATCCT6ATC3 ' 
(Position: 439 A 492) 

01igod6soxynucl6otide D 

5 'gatcaggaj:gcttaactctagcgacctgtcgctcgccccacagaacctcaccc3 ' 

(Position: 439 ^ 492) 



Hindlll 10 20 30 40 50 60 

aaocttTTAA ATCTTCATCC TTGGCAAGTA GATTCATCGG GTGTGTTTGA AGTAAGAATA 60 
ttcgaaAATT TAGAAGTAGG AACCGTTCAT CTAAGTAGCC CACACAAACT TCATTCTTAT 
TTTGCTTGTT TTTATGGTAT CAAAGGTATA TGTTGTAGAA GACAATTTCC GGTAATCCAA 120 
AAACGAACAA AAATACCATA GTTTCCATAT ACAACATCTT CTGTTAAAGG CCATTAGGTT 

TTGTCTGTCT GCTCAGTTTA GCACATGTAT AGTACGTTGC ACATAGTCTA CAATATTCAG 180 
AACAGACAGA CGAGTCAAAT CGTGTACATA TCATGCAACG TGTATCAGAT GTTATAAGTC 

CATTCAGCAT TCAGTATACA GCATATGGCT AAATGATCAC AAATGTGATT GATGATTTGA 240 
GTAAGTCGTA AGTCATATGT CGTATACCGA TTTACTAGTG TTTACACTAA CTACTAAACA 

CACGACTAGA AAAGAGAACG AAAAAGGGAA ATTCATGTCA CGTGCGTTGG CACGTGACAT 300 
GTGCTGATCT TTTCTCTTGC TTTTTCCCTT TAAGTACAGT GCACGCAACC GTGCACTGTA 
GGAATATCGA AGAAAGAAAA AAAAAAACGA TCTCGTCCTA GTGGAAGCCC AGAGTCTGGT 360 
CCTTATAGCT TCTTTCTTTT TTTTTTTGCT AGAGCAGGAT CACCTTCGGG TCTCAGACCA 
CCCCCCGGAG TCTTCCCAAA ACAAGAAGCT GACACATGTT GACACAGAAC ACCCCACAGC 420 
GGGGGGCCTC AGAAGGGTTT TGTTCTTCGA CTGTGTACAA CTGTGTCTTG TGGGGTGTCG 
AAATGCACCA CGCTACGTAG ATCAGG ATGC TT AACTCTAH CGACCTGTCG CTCGCCCCAC 480 
TTTACGTGGT GCGATGCATC TAGTCCTACG AATTGAGATC GCTGGACAGC GAGCGGGGTG 
AGAACCTCAC CCGAGAACCA CACATTACAC GCCGCCAGCT CCCACTATAC TCATCTTGCT 54 0 
TCTTGGAGTG GGCTCTTGGT GTGTAATGTG CGGCGGTCGA GGGTGATATG AGTAGAACGA 
TCCCTTAAGC GTTCTCACGA TTCGTTCGCT GCCCTTCTTC AAGAGTCTTC TGATTCTAAT 600 
AGGGAATTCG CAAGAGTGCT AAGCAAGCGA CGGGAAGAAG TTCTCAGAAG ACTAAGATTA 
TCTCATTCGA AATCCTCTAC AGTTAATGAA TTGCTTGACA TGACATTCAT TGTCTCATGG 660 
AGAGTAAGCT TTAGGAGATG TCAATTACTT AACGAACTGT ACTGTAAGTA ACAGAGTACC 
TTTTGGCTTT TTGGCTTTTG TCTTTTAAAG CTATATCAAC TTTACATATA AATATACGTC 720 
AAAACCGAAA AACCGAAAAC AGAAAATTTC GATATAGTTG AAATGTATAT TTATATGCAG 
AAAAGGGGAT TCATTAATTA GAAAATTCTC TTTTTCAATA GTTGCTATTC ATTATCAATC 780 
TTTTCCCCTA AGTAAtTAAT CTTTTAAGAG AAAAAGTTAT CAACGATAAG TAATAGTTAG 
TATTCAACTC AATTGGTTAT TATTTTCATC TTTTTGTCAT CCTAAACCAT CAACAATATT 840 
ATAAGTTGAG TTAACCAATA ATAAAAGTAG AAAAACAGTA GGATTTGGTA GTTGTTATAA 
TAAATATATC TGTTGCTACA TTAAGAGTTA CTTCAGAAAT AACAAAAAAA TCGATCAAGA 900 
ATTTATATAG ACAACGATGT AATTCTCAAT GAAGTCTTTA TTGTTTTTTT AGCTAGTTCT 
ATTAATAAAA Aatcaac g-L7 
TAATTATTTT Tcagctg 
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